用于吸烟行为检测的可解释特征学习框架(附论文下载)
关注并星标
从此不迷路
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
论文获取|回复“IAYOLO”获取paper
计算机视觉研究院专栏
作者:Edison_G
随着世界迈向第四次工业革命,需要采取可靠的环保侦探措施,以应对这种在智能城市内外对公共健康有害的醉酒行为。
除了机器视觉深度学习的进步和智能城市中相机的快速普及之外,对公共卫生的需求帮助我们提出了使用VGG16相关深度神经网络进行特征学习和分类的吸烟行为检测计算机视觉解决方案。
这个可解释的神经网络根据其性能进行评估,并使用LRP、遮挡分析和Integrated Gradient (SmoothGrad) 解释其检测决策,比较学习特征的可解释性以评估烟雾行为检测的可信度,基于在训练中学到的最相关的吸烟特征。
3.1
Dataset Description
在这项研究中,研究者使用了SmokerVsNonsmoker数据集,其中包含吸烟和不吸烟的图像。该数据集共包含2400张原始图像,其中1200张图像属于吸烟(吸烟者)类别,其余一半属于未吸烟(non-smokers)类别。对于一定程度的类间混淆(对于
更好的模型训练),考虑两个类别中的通用图像;
吸烟类别包括多个角度的吸烟者图像和各种手势
不吸烟类别包含不吸烟者的图片,诸如人们喝水、拿着手机、咬指甲等类似吸烟图像的手势
还使用了Google搜索中的一组图片(关键词如吸烟、吸烟者、人、咳嗽、打电话、饮用水等)。
3.2
Data preparation and Processing
随机选择六个图像并缩放它们以获得相似的尺寸。然后,执行通用数据可视化以识别和学习任何指示吸烟的特征。在这个实现中,我们只关注两个类(吸烟/不吸烟)并保存各自的图像标签。
四、实验及可视化
Training and Validation Accuracy and Loss
Relevance Maps for Smokers
Relevance Maps for Non-Smokers
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
扫码关注
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
论文获取|回复“IAYOLO”获取paper
往期推荐
🔗